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Verfahren und Vorrichtung zur Reduzierung zufalliger, kontinuierlicher, in- 
stationarer Storungen in Audiosignalen 



Die Erfindung betrifft ein Verfahren und eine Vorrichtung zur Reduktion von Sto- 
rungen in Audiosignalen, wobei die Storung eine zufallige, instationare Storgrofte 
n(k) darstellt, die zu alien Zeitpunkten k dem Nutzanteil s(k) des Audiosignals x(k) 
uberlagert ist. Derartige Storungen werden im Folgenden als zufallig, kontinuier- 
lich und instationar bezeichnet. Dabei liegen die Audiosignale entweder in diskre- 
ter Form vor Oder werden aus der Abtastung eines analogen zufallig, kontinuier- 
lich, instationar gestorten Audiosignals gewonnen. 

Audiosignale sind oftmals durch zufallige, kontinuierliche stationare und/oder 
instationare Storungen - im folgenden kurz auch als Storgerausche oder 
RauschstSrungen bezeichnet - beeintrachtigt, die die Qualitat des SignalsTiegativ 
beeinflussen. Die Reduzierung bzw. Entfemung dieser Storgerausche erfolgt 
ublicherweise durch die Filterung des gestorten Audiosignals mittels einer Filter- 
funktion, bei der das gefilterte Ausgangssignal das gerauschreduzierte bzw. un- 
gestorte Audiosignal moglichstgut approximieren soil. Die Berechnung der Filter 



funktion erfolgt dabei unter der Annahme der Stationaritat des Storsignals. 

Im Rahmen der voriiegenden Patentanmeldung wird von der Annahme ausge- 
gangen, dass sich das zufallig, kontinuierlich und instationar gestorte, diskrete 
Audiosignal x(k) , welches aus der Abtastung eines analogen, gestorten Audio- 
signais x(t) an den diskreten Abtastzeitpunkten k unter Beachtung des Nyquist- 
Theorems hervorgegangen ist, additiv aus einem diskreten, ungestorten 
Audiosignal s(k) , dem Nutzanteil des Audiosignals, und einem diskreten, zufalli- 
gen, kontinuierlichen Stdrsignal n(k), dem Storanteil des Audiosignals, 
zusammensetzt, wobei n{k) stationare und instationare Rauschanteile umfassen 
kann: 

x(k) = s(k) + n(k) (1) 

Ein bekanntes Verfahren zur Reduzierung bzw. Entfernung derartiger, zufalliger, 
kontinuierlicher Stbrungen, das sogenannte Verfahren zur „kurzzeitigen spektra- 
len Dampfung - im folgenden kurz Short Time Spectral Attenuation (STSA) ge- 
nannt - ist in dem Blockschaltbild gemaR Figur 1 wiedergegeben. Dargestellt ist 
die Bearbeitung eines Audiosignals x(k), welches als Abtastsignal x(k) des ana- 
logen, gestorten Audiosignals x(t) an den Abtastzeitpunkten k gewonnen wird. 

X(m,l), S(m,l) und N(m,l) sind die den diskreten Signalen x(k), s(k) und n(k) 
entsprechenden Funktionen beispielsweise im Frequenzbereich, wobei m die 
diskrete Frequenz bedeutet. Alternativ kann m jedoch ein anderer Parameter 
sein, der eine aquivalente Beschreibung der diskreten Zeitsignale x(k), s(k) und 
n(k) ermoglicht. / ist die diskrete Zeit des jeweils betrachteten Signalblockes bei 
der ublichen blockweisen Signalverarbeitung. Im Frequenzbereich gilt daher ent- 
sprechend 

X(m,l) = S(m,l) + N(m,l) (2) 

Das diskrete Audiosignal x(k) wird bei diesem bekannten Verfahren in einem 
ersten Schritt, mittels einer diskreten Fouriertransformation in den Frequenzbe- 
reich transformiert, Block 1, so dass sich die diskrete Frequenzbereichsdarstel- 
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lung X{m,l) ergibt. Aus dieser diskreten Spektraldarstellung erfolgt bei dem 
dargestellten Stand der Technik eine einzige und somit stationare Schatzung 
6 /w (w)der diskreten Autorauschieistungsdichte ® m (m) durch ein bekanntes 
Schatzverfahren, Block 2, bei dem beispielsweise eine 

(3a) Schatzung der Autorauschieistungsdichte innerhalb (annahernd) nutz- 

signalfreier Passagen des gestorten Signals oder eine 
(3b) sog. direkte Schatzung 

vorgenommen wird. 

Die geschatzte diskrete Autorauschieistungsdichte ergibt sich aus ei- 

nem diskreten, zufallig, kontinuierlich gestorten Audiosignal entsprechend des in 
(3a) genannten Verfahrens durch Auswertung annahernd audiosignalfreier Pas- 
sagen des gestorten Signals,. in denen naherungsweise gilt 

x(k) « n(k) , da s(k) * 0 . (3) 

Unter Ausnutzung der Linearitat der Fouriertransformation ergibt sich innerhalb 
dieser Abschnitte, in denen s(k)«0, eine Schatzung der diskreten Autorauschieis- 
tungsdichte gemati 

6 M (m) = fe(m). (4) 

Hier bedeutet ^^(m) die Autorauschieistungsdichte des gestorten Audiosig- 
nals. 

Das alternative "direkte Schatzung" genannte Verfahren (3b) wurde in „Steven L. 
Gay, Jacob Benesty: Acoustic Signal Processing for Telecommunication ; Kluwer 
International Series in Engineering and Computer Science; Kapitel 9: Eric J. Di- 
ethorn: Subband Noise Reduction Methods for Speech Enhancement, Marz 
2000, ISBN 0-7923-7814-8" vorgestellt und beruht auf einer beschrankten Ver- 
folgung der Leistungsdichte des gestorten Signals. 



Basierend auf der Schatzung der Autorauschleistungsdichte <b m (m) und der 
diskreten Frequenzbereichsdarstellung X{m,l) des diskreten Audiosignals x(k) 
erfolgt bei diesem bekannten Verfahren die Bestimmung einer geeigneten Filter- 
funktion #g(w,/) , vgl. Block 3, bei der das abgegebene Signal das ungestorte 
Audiosignal s(k) moglichst genau approximiert. In diesem Zusammenhang sind 
verschiedene Berechnungsvorschriften zur Gewinnung der Filterfunktion 
Ha{m,V) bekannt, beispielsweise der 

(6a) Ansatz nach Wiener, bei dem als Approximationskriterium der mittle- 
re quadratische Fehler zwischen Nutzsignal und Schatzung verwen- 
det wird Oder der 

(6b) Ansatz zur Amplituden-Subtraktion oder der 

(6c) Ansatz zur Leistungs-Subtraktion, 

die in „S. F. Boll; Suppression of acoustic noise in speech using spectral subtrac- 
tion; IEEE Trans. Acoust., Speech & Signal Process.; ASSP-27; Seite 113-120; 
1979", auflerdem auch in dem Lehrbuch von P. Vary, U. Heute & W. Hess, "Digi- 
tate Sprachsignalverarbeitung", Teubner Verlag, Stuttgart 1998, ISBN 3-519- 
06165-1, Seiten 380-390, beschrieben sind. 

Zur Bestimmung einer Schatzung s(k) des diskreten, ungestorten Nutzanteils 
s(k) erfolgt eine Filterung des diskreten Audiosignals x{k) mit der zuvor be- 
stimmten Filterfunktion. Diese kann entweder im Zeitbereich durch die Faltung 
des diskreten, gestorten Signals x(k) mit der diskreten Impulsantwort der Filter- 
funktion hc(k) realisiert werden 

s{k) = h G (k)*x(k), ( 5 ) 

wobei * den Faltungsoperator darstellt oder wie in Fig. 1 dargestellt, im Fre- 
quenzbereich durch die Multiplikation der diskreten Ubertragungsfunktion 
Ho(m,t) mit der diskreten Spektraldarstellung X(m,l) des diskreten, gestorten 
Audiosignals x(k,l), vgl. Block 4, 



S(m,l) = H G (m,l)-X(m,l). 



(6) 



Aus der derart bestimmten diskreten Schatzung S(m,l) wird die entsprechende 
Darstellung s(k) im Zeitbereich durch die inverse, diskrete Fouriertransformation 
gewonnen, vgl. Block 5, so dass das gerauschbefreite Signal ggf. mittels eines 
Digital-Analog-Wandlers in ein analoges, gerauschbefreites Signal umgesetzt 
werden kann. 

Ein Nachteil dieses bekannten Verfahrens besteht darin, dass durch die Filterung 
des gestorten Audiosignals erneut Storungen in das gerauschbefreite Signal ein- 
getragen werden, die durch die Filterung entstehen und zu unerwunschten sog. 
„Musical Tones" fuhren. 

Ferner ist aus „M.Berouti, R. Schwartz & J. Makhoul; Enhancement of speech 
corrupted by acoustic noise; in Proc. IEEE ICASSP; Seite 208-211; Washington 
DC; 1979" ein weiteres Verfahren bekannt, das im folgenden anhand des Block- 
schaltbildes gemafS Figur 2 beschrieben ist und welches in seinem Grundprinzip 
dem Verfahren gema& Figur 1 entspricht. Dieses bekannte Verfahren arbeitet auf 
folgende Weise: 

Aus einer einmaligen und somit stationaren Schatzung der Autorauschleistungs- 
dichte O m (m), Block 2, und der diskreten Spektraldarstellung X(m,l), am Aus- 
gang des Blocks 1 des diskreten Audiosignals x(k) wird die Filterfunktion 
Ho(m,l) ermittelt, Block 3. Vor der eigentlichen Filterung des gestorten Signals, 
Block 4, wird die Filterfunktion Ha(m,l) auf einen konstanten, frei gewahlten 
minimalen Wert PfM - auch als ..spektraler Boden" bezeichnet -, d. h. auf eine 
maximale Gerauschreduktion, beschrankt, Block 6. Somit ergibt sich fur die Filte- 
rung eine neue diskrete Filterfunktion Hc(m,l, y se bnl) , fur die gilt: 




(7) 
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Diese beschrankte Filterfunktion fuhrt einerseits dazu, dass keine Gerauschbe- 
freiung, sondern nur eine Reduktion der Storung mdglich ist, andererseits wird 
die Entstehung von sog. Musical Tones deutlich reduziert. 

Das durch die Fiiterung, Block 4, gewonnene diskrete, gerauschreduzierte Sig- 
nalspektrum S(m,l) wird anschlieliend wie in dem Verfahren gemali Figur 1 - 
durch eine inverse, diskrete Fouriertransformation, Block 5, in den Zeitbereich^ 
zurucktransformiert. 

Bei beiden bekannten Verfahren erweist es sich als nachteilig, dass diese nur zur 
Entfernung bzw. Reduktion zufalliger, kontinuierlicher stationarer und ggf. zufalli- 
ger, kontinuierlicher langsam instationarer Storungen herangezogen werden 
konnen. Zeitliche Anderungen der statistischen Eigenschaften der diskreten Sto- 
rung n(k) konnen nicht oder nur bei sehr langsamen Anderungen erfasst wer- 
den. Handelt es sich bei der uberlagerten Storung jedoch beispielsweise um ein 
instationares Rauschen, ergibt sich eine fehlerbehaftete Schatzung der Auto- 
rauschleistungsdichte. Hieraus resultiert eine fehlerhafte Bestimmung der Filter- 
funktion und somit eine Gerauschreduktion, die entweder das eigentliche unge- 
storte Signal s(k) beeintrachtigt und/oder das Stbrsignal n{k) nur unzureichend 
reduziert. 

Bei Verwendung einer einmaligen und somit stationaren Schatzung der Auto- 
rauschleistungsdichte innerhalb nutzsignalfreier Abschnitte ergibt sich eine feh- 
lerhafte Autorauschleistungsdichte, da ein zufallig, kontinuierlich gestortes Au- 
diosignal in der Regel nicht ausreichend viele nutzsignalfreie Abschnitte aufweist, 
die eine fortlaufende Aktualisierung der Schatzung der Autorauschleistung erlau- 
ben. Somit kann der ermittelte Schatzwert den zeitlichen Anderungen der statisti- 
schen Eigenschaften des Rauschens keine Rechnung tragen. Zwar wird bei der 
geschilderten und bekannten „direkten Schatzung" die Autorauschleistungsdichte 
standig aktualisiert, jedoch ist die Schatzung fehlerhaft bezuglich des instationa- 
ren Rauschanteils, wie die diesbezuglichen Betrachtungen in „J. Meyer, K.U. 
Simmer and K.D. Kammeyer: Comparison of One- and Two-Channel Noise- 
Estimation Techniques ; Proc. 5th International Workshop on Acoustic Echo and 
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Noise Control (IWAENC-97), vol. 1, Seite 17-20, London, U.K., 11-12 September 
1997"zeigen. 

Aus dem US-Patent 5,852,567 ist ein weiteres Verfahren zur Reduzierung zufal- 
liger, kontinuierlicher Storungen bekannt. Basierend auf einer Zeit-Frequenz- 
Transformation wird bei diesem Verfahren versucht, den Signal-Rauschabstand 
und die Charakteristika des instationaren Nutzsignals zu verbessern. Wie bei den 
zuvor beschriebenen Verfahren erweist es sich auch bei diesem Verfahren als 
nachteilig, dass es ebenfalls entsprechend seines Entwicklungsziels nur zur Re- 
duzierung von zufalligen, kontinuierlichen, stationaren Storungen, nicht jedoch 
zur Reduzierung von zufalligen, kontinuierlichen, instationaren Storungen heran- 
gezogen werden kann. 

Der Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren und eine Vorrich- 
tung zur Reduzierung zufalliger, kontinuierlicher, instationarer Storungen in Au- 
diosignalen anzugeben, mit dem Ziel, den instationaren Rauschanteil im Audio- 
signal im Verhaltnis zu dessen stationaren Rauschanteil zu verringern. 

Diese Aufgabe wird gelost durch ein Verfahren gemafi Anspruch 1. Diese Aufga- 
be wird ferner gelost durch eine Vorrichtung gemafi Anspruch 1 1 . 

Die Vorteile des erfindungsgemaften Verfahrens und der erfindungsgemafien 
Vorrichtung bestehen darin, dass eine Representation des gestorten Audiosig- 
nals derart bearbeitet wird, dass die zeitiichen Anderungen der statistischen Ei- 
genschaften des Storanteils des bearbeiteten Audiosignals im Vergleich zum 
Storanteil des un bearbeiteten Audiosignals verringert werden. Es werden die 
zeitiichen Anderungen der statistischen Eigenschaften reduziert, so dass das 
Audiosignal nach der Bearbeitung nur noch durch eine zufallige, kontinuierliche, 
stationare Reststorung beeintrachtigt wird und gegebenenfalls eine weitere Re- 
duzierung des durchschnittlichen Rauschpegels zusatzlich vorgenommen wer- 
den kann. Bei der Bestimmung der Filterfunktion werden die aktuellen Eigen- 
schaften des Nutz- und des Storsignalanteils berucksichtigt. Das Mali der Ge- 
rauschreduktion, also die Filterfunktion, wird nicht auf einen festen Amplituden- 
wert beschrankt, sondem durch eine Representation der Storung oder einer di- 
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rekt oder indirekt hieraus ableitbaren Grofie dynamisch an die aktuellen zeitlich 
veranderlichen Eigenschaften des Storsignals angepasst. 

Gema^ einer besonders bevorzugten Ausfuhrungsform der Erfindung lafct sich 
eine Representation der Storung bestimmen, die die zeitiichen Veranderungen 
der instationaren statistischen Eigenschaften des Rauschens beschreibt. 

Ein weiterer entscheidender Vorteil des erfindungsgemaften Verfahrens ist die 
Einbeziehung der aktuellen Storsignaleigenschaften. Bisherige Verfahren be- 
rucksichtigen in diesem Zusammenhang nur einen zeitlich begrenzten Signal- 
ausschnitt, so dass sich den andernden Eigenschaften des Storsignalanteils kei- 
ne Rechnung getragen wurde. 

Vorteilhafte Weiterbildungen der Erfindung sind durch die Merkmale der Unter- 
anspruche gekennzeichnet. 

Im Folgenden werden Ausfuhrungsbeispiele der Erfindung anhand der Zeich- 
nung naher erlautert. Eszeigen: 

Figur 1 ein Blockschaltbild eines bekannten Verfahrens zur Reduzierung zu- 
falliger kontinuierlicher Storungen in Audiosignalen; 

Figur 2 ein Blockschaltbild eines weiteren bekannten Verfahrens zur Redu- 
zierung zufalliger kontinuierlicher Storungen in Audiosignalen; 

Figur 3 eine schematische Darstellung des erfindungsgemafien Verfahrens; 

Figur 4 ein Blockschaltbild einer ersten Ausfuhrungsform des erfindungsge- 
mafien Verfahrens; 

Figur 5 ein Blockschaltbild einer zweiten Ausfuhrungsform des erfindungs- 
gemaften Verfahrens; 

Figur 6 ein Blockschaltbild einer dritten Ausfuhrungsform des erfindungsge- 
maRen Verfahrens, 



Figur 7a, 

bis 7c der typische zeitliche Verlauf des Storanteiles a) eines gestorten Au- 
diosignales, b) des gemafi dem Stand der Technik bearbeiteten Au- 
diosignales und c) des mit dem erfindungsgemalien Verfahren bear- 
beiteten Audiosignales. 

Figur 8 eine exemplarische Darstellung der Wirkungsweise des Verfahrens 
gemafi Fig. 2, 

Figur 9 eine schematische Wirkungsweise einer Ausfuhrungsform des be- 
kannten Verfahrens bei Verwendung einer Abschatzung des aktuell 
enthaltenen Storsignalanteils, welcher die zeitliche Anderung der Sto- 
rung beschreibt zur Bestimmung der Filterfunktion H d J n (mJ) und de- 
ren Beschrankung mittels einer zeitlich konstanten Beschrankungs- 
funktion y SF (m) 

Figur 10 eine exemplarische Darstellung der Wirkungsweise einer Ausfuh- 
rungsform des erfindungsgemafien Verfahrens. 

Figuren 3 und 4 zeigen ein schematisches Blockschaltbild einer ersten Ausfuh- 
rungsform des erfindungsgemafien Verfahrens. Gemafi dem Blockschaltbild 
nach Figur 3 wird aus einem diskreten, gestorten Audiosignal x(k) durch eine 
entsprechende Transformation, beispielsweise eine Transformation des Signals 
x(k) in den Frequenzbereich, eine zugehorige Representation x(m,l) dieses 
Audiosignals bestimmt, Block 1. Die Variable / beschreibt in diesem Zusammen- 
hang den aktuellen Betrachtungszeitpunkt. Diese Reprasentation wird in einer 
Bearbeitungseinheit 2 bearbeitet. Aus der Bearbeitung dieser Reprasentation 
entsprechend dem erfindungsgemafien Verfahren ergibt sich die bearbeitete, 
neue Reprasentation s(m,l) des Audiosignals, die durch eine Verringerung der 
zeitlichen Anderungen der statistischen Eigenschaften des enthaltenen Storan- 
teils gekennzeichnet ist. Schlielilich wird dann durch eine entsprechende Ruck- 
transformation der diskrete Signalverlauf s(k) gewonnen, der den diskreten, zeit- 
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lichen Verlauf des gerauschreduzierten Audiosignals als Funktion der diskreten 
Abtastzeitpunkte beschreibt. 

Gema£ Figur 4 wird aus einer Reprasentation des gestorten Audiosignals 
X 2 (m,l),- die beispieisweise durch eine geeignete Abbildungsvorschrift aus der 
Reprasentation X(m, I) hervorgeht und das aus dem Zeitbereich in den Fre- 
quenzbereich transformierte Signal x(k) reprasentiert-, vgl. Block 5, und der 
Reprasentation N(m,l), die eine Schatzung der aktuellen Eigenschaften des 
Stbrsignalanteils im Frequenzbereich darstellt, in bekannter Weise unter Heran- 
ziehung der Schatzung N(m,l) des Storanteils des Audiosignals eine geeignete 
Filterfunktion H d J n (m,l) bestimmt. Zusatzlich wird die so bestimmte Filterfunktion 
H d J n (m,l) unter Heranziehung der Schatzung N(m,l) des Storanteils des Au- 
diosignals dynamisch, d.h. zeitabhangig, beschrankt, vgl. Block 4 und 6. Das 
Superscript dyn kennzeichnet eine Filterfunktion, die durch Einbeziehung der 
aktuellen Eigenschaften des instationaren Storanteils des Audiosignals gewon- 
nen wird. 

In einem weiteren Bearbeitungsschritt wird die Reprasentation x(m,l) des ge- 
storten Audiosignals x(k) mit der beschrankten Filterfunktion gefiltert, vgl. Block 
7, so dass sich ein bearbeitetes diskretes Signal S(m,l) ergibt. Aus dieser Rep- 
resentation S(m,l) ergibt sich mittels einer geeigneten Riicktransformation ein 
diskreter Signalverlauf s(k) , der dem diskreten, zeitlichen Verlauf des gestorten 
Audiosignals x(k) entspricht, jedoch durch eine geringere zeitliche Anderung der 
statistischen Eigenschaften der enthaltenen Storung gekennzeichnet ist. 

Figur 5 zeigt das Blockschaltbild zur Realisierung einer zweiten Ausfuhrungsform 
des erfindungsgemaBen Verfahrens. Aus dem diskreten, gestorten Audiosignal 
x(k) wird jeweils zum Betrachtungszeitpunkt / beispieisweise durch eine Fou- 
riertransformation eine geeignete Reprasentation X(m,l) dieses Audiosignals 
bestimmt, vgl. Block 1. Hieraus wird eine Schatzung N(mj) des dem ungestor- 
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ten, diskreten Audiosignal s(k) uberlagerten instationaren, zufalligen und konti- 
nuierlichen Storungsanteil n(k) gewonnen, vgl. Block 4, welche die aktuellen 
statistischen Eigenschaften des instationaren Rauschens beschreibt. Unter Ver- 
wendung der Schatzung N(m,l) wird, unter Heranziehung der Representation 
des gestbrten Signals X(m,l) - die gegebenenfalls durch eine geeignete Abbil- 
dungsvorschrift (nicht dargestellt) zusatzlich verandert wird - eine geeignete Fil- 
terfunktion H% n (m,l) bestimmt, vgl. Block 8, die im Gegensatz zu den bekann- 
ten Verfahren die Instationaritat des Storanteils berucksichtigt. Diese Filterfunkti- 
on H^ n {m,l) wird im folgenden Schritt auf einen minimalen Wert y SF {mj) be- 
schrankt, vgl. Block 9. Diese Grenze - auch Beschrankungsfunktion genannt - ist 
nicht konstant, sondern bestimmt sich dynamisch in Abhangigkeit von einer 
direkten oder indirekten Representation der Storung 

YsAmj) = f{N(rn,l)). (8) 

Besonders bevorzugt lalit sich zur Berechnung von y^mj] zusatzlich auch noch 
eine Representation des gestorten Audiosignals x(k) heranziehen. Es gilt dann 

Yj<m,l) = f{N(m,l),X{m,l)). (9) 

Fur die derart beschrankte Filterfunktion H b gilt dann: 

H b =HT^r s M'))A Hr ^ 1 } ^ ^M*^') 

[YsfV"' 1 ) sonst. 
(10) 

Eine geeignete Verknupfung - beispielsweise eine Multiplikation - einer Repre- 
sentation X(m,l) des gestorten Audiosignals x(k) mit der zuvor ermittelten be- 
schrankten Filterfunktion H b = H^"(m,l,y SF (m,l)) liefert dann ein diskretes Sig- 
nal S(m,l), aus dem sich durch eine der Transformation entsprechende 
Rucktransformation eine diskrete Signalfolge s(k) ableiten lasst, die dem 
gestbrten Audiosignal x(k) entspricht, jedoch durch eine geringere zeitliche 
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Audiosignal x(k) entspricht, jedoch durch eine geringere zeitliche Anderung der 
statistischen Eigenschaften der enthaltenen Storung gekennzeichnet ist, vgl. 
Block 6. 

In Figur 6 ist ein Blockschaltbild einer dritten Ausfuhrungsform des erfindungs- 
gemafien Verfahrens dargestellt, welches zur Reduzierung einer zufaliigen, kon- 
tinuierlichen, instationaren Storung in einem Audiosignal dient, das durch eine 
amplitudenmodulierte Rauschstorung mit konstanter spektraler Farbung beein- 
trachtigt ist. Aus dem diskreten, gestorten Audiosignal x(k) wird durch eine 
schnelle Fouriertransformation (FFT) das diskrete Spektrum X(m,l) des 
gestorten Audiosignals im Betrachtungszeitpunkt / gewonnen, vgl. Block 10 
x(m,l) wird auch als Reprasentationsform des gestorten Audiosignals 
bezeichnet. Anhand dieses diskreten Spektrums x(m,l) wird eine Schatzung 
der zum Betrachtungszeitpunkt / gultigen Auto-Rauschleistungsdichte, 
<b m (m,l), vorgenommen, welche ein Mafi fur den Storanteil n{k) im gestorten 
Audiosignal x(k) ist. Diese Schatzung erfolgt in zwei Schritten: 

In einem ersten Schritt wird durch eines der bekannten Schatzverfahren ein 
Schatzwert <£> m (m) der stationaren Auto-Rauschleistungsdichte ermittelt, 
die die spektrale Farbung, nicht aber den zeitlichen Verlauf der Storung be- 
schreibt, Block 22. 

In einem zweiten Schritt wird dann eine Grolie bestimmt, welche die Instati- 
onaritat der Storung kennzeichnet, Block 24. Zu diesem Zweck wird aus der 
geschatzten Auto-Rauschleistungsdichte & m {m) und dem Spektrum 
X(m,l) des gestorten Audiosignals ein zeitvarianter Modulationsfaktor 
a(m,l) bestimmt, der die Amplitudenmodulation der Storung beschreibt, 
beispielsweise 
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Durch Multiplikation der geschatzten, stationaren Auto-Rauschleistungsdichte 
®m( m ) mit diesem Modulationsfaktor ergibt sich dann der gesuchte Schatzwert 
Q>im(™j) der tatsachlichen Auto-Rauschleistungsdichte <b m (m,l). Block 26: 

®nn (m, I) = aim, l)-<t> m (m) . (12) 

Hieraus erfoigt unter Einbeziehung der aktuellen, diskreten Fouriertransformier- 
ten X(m,l) des gestorten Audiosignals x(k) die Bestimmung einer Filterfunktion 
HT( m >l) fur den aktueilen Betrachtungszeitpunkt / mittels eines geeigneten 
Ansatzes, beispielsweise mittels des bekannten Ansatzes nach Wiener, Block 
30. 

Die Filterfunktion H% n (mj) wird im Folgenden mittels einer dynamisch an die 
Eigenschaften der Storung angepassten Beschrankungsfunktion, y SF (m,l) in 
ihrer Amplitude beschrankt, die sich beispielsweise aus dem zuvor berechneten 
Modulationsfaktor a(m,l) entsprechend 

7 SF (m,l)~(a(m,l)Y (13) 
mit -5 < p < +5; besonders bevorzugt ist p = -1/2, proportional verhalt, Block 40. 

Mittels der auf diese Weise gewonnenen Beschrankungsfunktion lasst sich dann 
die dynamisch beschrankte Filterfunktion ^gemafi Gleichung (10) bestimmen, 
Block 40. 

In einem weiteren Schritt wird anschlieUend die diskrete Fouriertransformierte 
des gestorten Signals x(m,l) mit der zuvor bestimmten, beschrankten Filter- 
funktion H b multipliziert, vgl. Block 50. Aus der sich ergebenden Schatzung 
S(m,l) lasst sich abschlieftend durch eine inverse, schnelle Fouriertransformati- 
on (IFFT) ein Signal s(k) bestimmen, Block 60, das dem gestorten Audiosignal 
durch eine verringerte Modulation der Storung, namlich eine geringere zeitliche 
Anderung der statistischen Eigenschaften der enthaltenen Storung, und durch 
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eine von der Beschrankungsfunktion y SF (mj) abhangige Gerauschreduktion 
gekennzeichnet ist. 

Figur 7a zeigt den zeitlichen Verlauf eines Storanteils n(k) , der einem beliebigen 
diskreten, ungestorten Nutzanteil s(k) Ciberlagert ist. Wird ein derart 
zusammengesetztes, diskretes, zufallig, kontinuierlich und instationar gestortes 
Audiosignal x(k) = s{k) + n{k) mittels eines in der Beschreibungseinleitung 
genannten bekannten Verfahrens bearbeitet, so ergibt sich ein Storanteil, der in 
Figur 7b dargestellt ist. Wird demgegenuber das instationar gestorte Audiosignal 
x{k) mit dem erfindungsgemaften Verfahren bearbeitet, so ergibt sich nach der 
Bearbeitung der in Figur 7c dargestellte resuitierende Storanteil der einen uber 
die Zeit gleichformigen, stationaren Charakter aufweist; die in den Figuren 7a 
und 7b vorhandene typische Instationaritat des Signals ist gemafi Figur 7c 
erfolgreich beseitigt. 

Zur Erklarung der Funktionsweise des erfindungsgemalien Verfahrens soil im 
Folgenden von einem Audiosignal x{k) ausgegangen werden, welches 
blockweise verarbeitet wird, dessen Reprasentation X(m,l) dem Quadrat der 
blockweisen Fouriertransformation entspricht. Das Audiosignal x(k) soli aus 
einer instationaren Storung n(k) bzw. N(m,l) bestehen und kein Nutzsignal 
s(k) enthalten. Somit gilt fur die diskrete Frequenz m,. (mit i = 1,2,3...) und die 
diskreten Zeitpunkte /, die den einzelnen Signalbl5cken zugeordnet sind: 

X(m i ,l) = N(m i ,l) (14) 

Exemplarisch ist in den zugehorigen Abbildungen, Figuren 8a, 9a, 10a der zeitli- 
che Verlauf N(m t ,I) fur eine diskrete Frequenz m i wiedergegeben. 

Bei Einsatz des bekannten Verfahrens mit begrenzter STSA wird aus der statio- 
naren Schatzung der Auto-Rauschleistungsdichte N(m t ) in Teilbild 8a, gestri- 
chelt und dem Storsignal eine Filterfunktion H G anhand eines geeigneten Ver- 
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fahrens (beispielsweise nach Wiener) berechnet, Teilbild 8b. In den Bereichen, in 
denen die reale Rauschreprasentation Nim^l) die stationare Schatzung N(m t ) 
unterschreitet, nimmt die Filterfunktion H G (m lt l) einen Wert nahe Null an, die 
Rauschstorung wird zu diesen Zeitpunkten / annahernd vollstandig unterdruckt. 
Fur diejenigen Zeitpunkte / in denen die Representation der realen Rauschleis- 
tungsdichte iVYm,.,/) grofier als die Schatzung 1st, nimmt die Filterfunktion 
H G ( m i>l) hingegen einen Wert nahe Eins an, da ein Teil des aktuellen Rausch- 
signals als Nutzsignal interpretiert wird. 

Begrenzt man diese Filterfunktion gemafi dem STSA-Verfahren auf eine 
konstante, zeitlich also unveranderliche untere Grenze y so ergibt sich 
ein zeitlicher Verlauf gemafi Teilbild 8c. Wendet man die so erzeugte 
Filterfunktion H G (mi,l,y SF (m)) auf das Storsignal an, so ergibt sich als Aus- 
gangsignal wiederum eine instationare Reststorung, vgl. Teilbild 8d. 

In Figur 9 ist die schematische Wirkungsweise des Verfahrens gemafi Fig. 8 dar- 
gestellt, bei dem jedoch die einmalig geschatzte, und somit stationare Represen- 
tation der Autorauschleistungsdichte #(#»,) durch eine dynamische, d.h. durch 
eine die zeitlichen Anderungen der Storung beschreibende Schatzung der Auto- 
rauschleistungsdichte N(m„I) ersetzt wird. Als Filterfunktion Hg"(m„l) wird 
beispielsweise mittels des Ansatzes nach Wiener eine Funktion gewonnen, die 
durch eine konstante Beschrankungsfunktion ^K) gemaft Gleichung (7) auf 
eine zeitlich unveranderliche Untergrenze festgelegt wird, vgl. Fig. 9c. Erfahrt das 
Filtersignal eine Filterung mit der beschrankten Filterfunktion ^"(/w f ,/,^(w f )), 
so enthalt das bearbeitete Signal gemafi Fig. 9b eine restliche Storung, deren 
Amplitude gegenuber der Amplitude nach Fig. 8d deutlich reduziert ist, wobei 
jedoch die Instationaritat des Storsignals nicht beseitigt ist. 

Erganzt man das anhand der Fig. 9a bis 9d beschriebene Verfahren urn einen 
weiteren Schritt, so erhalt man das erfindungsgemaGe Verfahren gemafi Fig. 10. 
Beschrankt man die Filterfunktion H*"(m i9 l) gemafi der Figur 9b mittels einer 
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zeitlich veranderlichen Beschrankungsfunktion r SF (m i} l) beispielsweise gemaft 
Gleichung (13), so ist es moglich, eine Reststorung im Ausgangssignal zu errei- 
chen, die nahezu oder vollstandig stationar ist, die zeitiiche instationaritat des 
Signals n(k) also nicht mehr enthalt. Aus der Schatzung Nim.,1), welche die 
zeitiiche Anderung der Storung beschreibt, Figur 10a, und aus dem gestdrten 
Signal X{m,l) wird die Filterfunktion Hf '(m,,!) bestimmt, vgl. Figur 10b. Diese 
wird durch eine zeitlich veranderliche Beschrankungsfunktion Y SF {rm,l) gemafi 
Gleichung (10) beschrankt, so dass sich hieraus die dynamisch beschrankte Fil- 
terfunktion H b =H% n (mi,l,y SF (mi,l)) gemafi den Gleichungen (10) und (13) er- 
gibt, vgl. Figur 10c. Die Filterung des Eingangssignals mit dieser Filterfunktion 
fuhrt nun zu einem bearbeiteten Signal, das nur noch eine stationare Reststorung 
enthalt, vgl. Figur 10d. 
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Anspruche 



1 . Verfjhren zur Reduktion zufailiger, kontinuierlicher, instationarer Storungen in 
Audiosignalen, die in diskreter Form vorliegen oder aus der Abtastung eines ana- 
logen zufallig, kontinuierlich, instationar gestorten Audiosignal gewonnen werden, 
wobei das gestdrte Audiosignal mittels einer Filterfunktion gefiltert wird, 
dadurch gekennzeichnet, dass die Filterfunktion dynamisch unter Berucksichti- 
gung der aktuellen Eigenschaften des gestorten Audiosignals und/oder seiner 
Bestandteile bestimmt wird, und dass die Filterfunktion dynamisch unter Beruck- 
sichtigung der aktuellen Eigenschaften des im gestorten Audiosignals enthalte- 
nen Storanteils begrenzt wird. 

2. Verfahren nach Anspruch 1 , 
dadurch gekennzeichnet, 

dass eine Abschatzung des Storanteils des gestorten Audiosignals erzeugt wird, 
welche die zeitiiche Anderung der Storung beschreibt, 

dass aus der Abschatzung des Storanteils die unbeschrankte Filterfunktion 
HG{m,l) in an sich bekannter Weise bestimmt wird, 

dass eine Beschrankungsfunktion Y SF (rn,l) in Abhangigkeit von dem geschatz- 
ten Storanteil des gestdrten Audiosignals erzeugt wird, und dass eine beschrank- 
te Filterfunktion H b erzeugt wird gemaft 



und zur Filterung des gestorten Audiosignals verwendet wird, 
wobei m die betrachtete diskrete Spektralfrequenz oder ein anderer Parameter 
ist, der eine aquivalente Darstellung der Signale erlaubt und / die diskrete Zeit 
des jeweils betrachteten Signalblockes bei blockweiser Signalverarbeitung ist, 
wobei ein Block auch nur einen Abtastwert beinhalten kann. 




3. Verfahren nach einem der Anspruche 1 oder 2, 
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dadurch gekennzeichnet, dass die Beschrankungsfunktion y SF {m,l) in zeitlicher 
Abhangigkeit von der zeitlich veranderlichen Schatzung des Storanteils des ge- 
storten Audiosignals erzeugt ist. 

4. Verfahren nach Anspruch 3, 

dadurch gekennzeichnet, dass die Beschrankungsfunktion y SF (m,l) in 
Abhangigkeit von der zeitlich veranderlichen, momentanen Storleistung des 
geschatzten Storanteils des gestorten Audiosignals erzeugt wird. 

5. Verfahren nach einem der Anspruche 1 bis 4, 

dadurch gekennzeichnet, dass die beschrankte Filterfunktion in einem Verfah- 
rensschritt erzeugt wird. 

6. Verfahren nach einem der vorstehenden Anspruche, 

dadurch gekennzeichnet, dass die Filterung des gestorten Audiosignals im Zeit- 
bereich, im Frequenzbereich Oder in einem anderen mathematisch beschreibba- 
ren Signalraum ausgefuhrt wird. 

7. Verfahren nach einem der vorstehenden Anspruche, 

dadurch gekennzeichnet, dass die unbeschrankte Filterfunktion H d >"(m,l) ge- 
maft einem Ansatz nach Wiener bestimmt wird, bei dem als Approximationskrite- 
rium der mittlere quadratische Fehler zwischen Nutzsignal und Schatzung ver- 
wendet wird. 

8. Verfahren nach einem der vorstehenden Anspruche, 

dadurch gekennzeichnet, dass die unbeschrankte Filterfunktion Hf(m,l) nach 
dem Verfahren der Amplituden-Subtraktion bestimmt wird. 

9. Verfahren nach einem der Anspruche 1 bis 8, 

dadurch gekennzeichnet, dass das gestorte Audiosignai x{k) in den Frequenz- 
bereich transformiert wird, anschlie&end der Storanteil N{m,l) des transformier- 
ten gestorten Audiosignals X(m,l) abgeschatzt wird, die unbeschrankte Filter- 
funktion H*"(m,l) und die Beschrankungsfunktion y SF (m,l) erzeugt wird und 



daraus die beschrankte Filterfunktion H b gebildet wird, anschliefcend das trans- 
formierte gestarte Audiosignal X(m,l) mit der beschrankten Filterfunktion H b 
multipliziert und anschlieflend in den Zeitbereich zurucktransformiert wird. 

10. Verfahren nach Anspruch 1, 

dadurch gekennzeichnet, dass die Filterfunktion H* yn (m,l) mittels eines 

bekannten Ansatzes unter Heranziehung einer Schatzung <t> m (m, I) der 
momentanen Autorauschleistungsdichte bestimmt wird. 

11. Verfahren nach Anspruch 10, 

dadurch gekennzeichnet, dass sich die Schatzung <3? m (m,l) der momentanen 
Autorauschleistungsdichte aus einer Gewichtung der Schatzung O^Om) mit 
einem zeitabhangigen Gewichtsfaktor a(m,l) zu 

6 AW (m,/) = a(m,/)-6 JW (m) 

bestimmt. 

12. Verfahren nach Anspruch 11, 

dadurch gekennzeichnet, dass sich der Gewichtsfaktor a(m,l) gemali 

ermittelt wird, wobei X(m,l) eine Representation des gestorten Audiosignals ist. 

13. Verfahren nach Anspruch 11 oder 12, 

dadurch gekennzeichnet, dass die dynamische Beschrankungsfunktion y SF (m,l) 
bestimmt wird zu 



y SF (m, I)~(a(m, l)f , mit - 5 < p < 5 . 



-20- 



14. Verfahren nach Anspruch 13, 
dadurch gekennzeichnet, dass 



15. Vorrichtung zur Reduktion zufalliger, kontinuierlicher, instationarer Storungen 
in Audiosignalen, die in diskreter Form vorliegen oder aus der Abtastung eines 
analogen, zufallig, kontinuierlich, instationar gestorten Audiosignals gewonnen 
werden, wobei das gestorte Audiosignal mittels einer Filterfunktion gefiltert wird, 
gekennzeichnet durch eine Einrichtung (4; 22) zur Abschatzung des Storanteils 
des gestorten Audiosignals, wobei diese Abschatzung die zeitliche Anderung der 
statistischen Eigenschaften der Storung berucksichtigt, 

eine Einrichtung (8; 30) zur Erzeugung einer unbeschrankten Filterfunktion £T*" 
in an sich bekannter Weise unter Berucksichtigung der zuvor ermittelten Ab- 
schatzung des Storanteils, welche die zeitlichen Anderungen der statistischen 
Eigenschaften der Storung berucksichtigt, 

eine Einrichtung (24, 40) zur Erzeugung einer zeitabhangigen Beschrankungs- 
funktion y SF in Abhangigkeit von dem geschatzten Storanteil des gestorten Au- 
diosignals, und 

eine Einrichtung (7; 40), welche aus der unbeschrankten Filterfunktion Hf und 
der zeitabhangigen Beschrankungsfunktion y SF eine beschrankte Filterfunktion 
H b erzeugt, und 

ein Filter (7; 50), welches das gestorte Audiosignal mit der beschrankten Filter- 
funktion H b filtert. 



16. Vorrichtung nach Anspruch 15, 

dadurch gekennzeichnet, dass die Einrichtung (g; 40) die beschrankte Filterfunk- 
tion H b gemali 



{VsfV 71 ^) sonst. 



erzeugt. 
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Zusammenfassunq 



Es wird ein Verfahren und eine Vorrichtung zur Reduktion zufalliger, kontinuierli- 
cher, instationarer Storungen in Audiosignalen vorgesehen, wobei das gestorte 
Audiosignal mittels einer vorgegebenen Filterfunktion gefiltert wird. Die Filterfunk- 
tion wird dynamisch unter Berucksichtigung der aktuellen Eigenschaften des ge- 
storten Audiosignals und/oder seiner Bestandteile bestimmt, und die Filterfunkti- 
on wird aufierdem dynamisch unter Berucksichtigung der aktuellen Eigenschaf- 
ten des im gestorten Audiosignal enthaltenen Storanteils begrenzt. 



